查看原文
其他

跟着谷歌资深软件工程师王泉,从0开始搭建完整声纹识别系统!

书涵 音视频开发进阶 2022-09-30
声纹识别系统如何搭建?

什么是声纹识别?一门位于音频信号处理、生物信息学以及人工智能等领域交汇点的交叉学科,它所解决的问题是从人的语音信号当中,识别出说话人的身份信息。

随着智能手机、智能家居以及云智能系统的普及,并随着人们的信息安全意识不断提升,声纹识别在我们的日常生活中也得到了越来越广泛的应用。而随着深度学习技术的发展,声纹识别技术也迎来了一个全新的时代


现如今声纹识别系统的应用已经比较广泛了。王泉老师一开始接触的时候也是同样的状况:单靠着一些知乎、论坛、学术网站的东西根本没办法专业、系统的入门声纹领域,因为都是碎片化、晦涩难懂的。

也有一些小伙伴处于当年同样的困境,基于此深蓝学院联合谷歌资深软件工程师,带大家从0开始搭建完整声纹识别系统

01

讲师介绍



王泉:美国谷歌公司声纹识别与语种识别团队负责人、资深软件工程师,IEEE高级会员。



本科毕业于清华大学自动化系,后取得美国伦斯勒理工学院计算机工程博士学位,曾在美国亚马逊公司参与智能音箱语音助手Alexa的研发。

在谷歌任职期间,带领团队将先进的声纹技术部署到了大量产品中,使得谷歌智能音箱成为市面上第一款支持多用户模式的同类产品。在声纹识别、声纹分割聚类、人声分离、语种识别、语音检测及语音合成等诸多领域拥有大量专利,发表多篇重量级论文,工作多次被VentureBeat、TechCrunch、Engadget、CNET等国际著名科技媒体专题报道,入选全球软件案例研究峰会百大案例。

所著《声纹技术:从核心算法到工程实践》一书荣获电子工业出版社优秀作者奖,于海外在线教育平台Udemy上开设的声纹识别英文课程被评为畅销课。

02

课程优势



课程的优势有哪些?


注重基础:详细讲解声纹识别技术中的基本概念和核心算法

内容全面:涵盖从上世纪60年代到2022年主流声纹识别技术

紧随前沿:着重介绍基于深度学习的声纹识别系统,分享学术界与工业界的最新成果

海量实践:配备练习题+编程题+项目作业扎实所学,最终从零搭建完整的声纹识别系统

全球同步:本课程的英文版本被海外最大在线教育平台Udemy评为Bestseller畅销课。


03

课程大纲



课程一共分为11章,每章都有详细讲解和课后作业,手把手教你搭建完整的声纹识别系统。


04

课程收获



  • 掌握声学、音频处理、声纹识别领域的基本概念和方法

  • 熟悉声纹识别技术的发展历程,理清不同方法背后的底层逻辑以及各自的优缺点

  • 掌握深度学习框架下的声纹识别系统设计与思路

  • 熟悉各种工具、代码库、数据集的使用,具备动手从零搭建深度声纹识别系统的能力

  • 具备阅读声纹领域前沿学术论文、开源软件文档的能力,能够从容完成论文选题与推进

  • 收获人工智能领域的实战经验,在互联网时代的职场中保持竞争优势


05

课程咨询


扫码添加深蓝学院-叶子语备注【811】,才会通过好友哦!

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存